SVM incrémental, parallèle et distribué pour le traitement de grandes quantités de données
نویسندگان
چکیده
Résumé. Nous présentons un nouvel algorithme de SVM (Support Vector Machine ou Séparateur à Vaste Marge) linéaire et non-linéaire, parallèle et distribué permettant le traitement de grands ensembles de données dans un temps restreint sur du matériel standard. A partir de l’algorithme de NewtonGSVM proposé par Mangasarian, nous avons construit un algorithme incrémental, parallèle et distribué permettant d’améliorer les performances en temps d’exécution et mémoire en s’exécutant sur un groupe d’ordinateurs. Ce nouvel algorithme a la capacité de classifier un million d’individus en 20 dimensions et deux classes en quelques secondes sur un ensemble de dix PC.
منابع مشابه
SVM incrémental et parallèle sur GPU
Résumé. Nous présentons un nouvel algorithme incrémental et parallèle de Séparateur à Vaste Marge (SVM ou Support Vector Machine) pour la classification de très grands ensembles de données en utilisant le processeur de la carte graphique (GPUs, Graphics Processing Units). Les SVMs et les méthodes de noyaux permettent de construire des modèles avec une bonne précision mais ils nécessitent habitu...
متن کاملApproche préventive pour une gestion élastique du traitement parallèle et distribué de flux de données
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملUn système de segmentation automatique de gestes appliqué à la Langue des Signes (An automatic gesture segmentation system applied to Sign Language) [in French]
RÉSUMÉ De nombreuses études sont en cours afin de développer des méthodes de traitement automatique de langues des signes. Plusieurs approches nécessitent de grandes quantités de données segmentées pour l’apprentissage des systèmes de reconnaissance. Nos travaux s’occupent de la segmentation semi-automatique de gestes afin de permettre d’identifier le début et la fin d’un signe dans un énoncé e...
متن کاملDu Calcul Séquentiel au Cloud Computing
Deux nouveaux concepts de calcul sont en train de modifier le monde informatique, comme l’a fait Internet à partir des années 80 : ce sont les concepts de «Grilles de calcul et de données» (Grid Computing et Datagrid) et de « Calcul dans les nuages » (Cloud Computing). Ils sont apparus pour répondre à une demande croissante des scientifiques et des industriels en puissance de calcul, en ressour...
متن کاملSVM et visualisation pour la fouille de grands ensembles de données
Résumé. Nous présentons un algorithme de SVM et des méthodes graphiques pour le traitement de grands ensembles de données. Pour pouvoir traiter de tels ensembles de données, nous utilisons une représentation des données de plus haut niveau (sous forme symbolique). L’algorithme de séparateur à vaste marge (SVM) est adapté pour pouvoir traiter ce nouveau type de données. Nous construisons un nouv...
متن کامل